سیستم شناسایی و طبقه‌بندی موجودیت‌های اسمی در متون زبان فارسی بر پایه شبکه عصبی

نویسندگان

چکیده مقاله:

Named Entity Recognition (NER) is a fundamental task in natural language processing and also known as a subset of information extraction. We seek to locate and classify named entities in text into predefined categories such as the names of persons, organizations, locations, expressions of times, etc. Named Entity Recognition for English texts has been researched widely for the past years, however only a few limited researches have emphasized on Persian NER due to the absence of resources for Persian named entities and the limited amount of progress made in Persian natural language processing in general. In this paper, a Persian named entity recognition system has been developed based on neural network with the study of researches conducted in other languages and benefiting from the latest methods in this area such as using the vector representation of words. The results from the proposed model show that word embedding features in Persian not only resolve the problem of feature selection, but also it could lead to the development of an efficient system with the least dependence to the domain.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

سیستم شناسایی و طبقه بندی اسامی در متون فارسی

Name entity recognition (NER) is a system that can identify one or more kinds of names in a text and classify them into specified categories. These categories can be name of people, organizations, companies, places (country, city, street, etc.), time related to names (date and time), financial values, percentages, etc. Although during the past decade a lot of researches has been done on NER in ...

متن کامل

شیوه‌های بیان گزاره اسمی در زبان روسی و فارسی

مقالة حاضر، به بررسی گزارة اسمی در زبان روسی و فارسی می‌پردازد. مفهوم گزاره و انواع آن مدت زمان مدیدی است که مورد بررسی دانشمندان و دستورنویسان می‌باشد. به هنگام بررسی گزارة اسمی در زبان روسی می‌بایست این نکته را خاطرنشان ساخت که در رابطه با ابن موضوع اختلاف نظرهای اساسی وجود دارد. در بحث مربوط به تئوری گزاره در زبان فارسی همچون زبان روسی، نقاط ضعف و نارسایی‌هایی نیز وجود دارد. در این مقاله، ان...

متن کامل

سلسله‌مراتب دسترسی گروه اسمی: فراگیری بندهای موصولی در زبان فارسی

کینان و کامری (1977) پس از بررسی 50 زبان، نظریۀ سلسله‌مراتب دسترسیِ گروه اسمی را معرفی کردند. در این نظریه ادعاشده‌است که زبان‌ها به‌طور جهانی برای موصولی‌سازی از یک سلسله‌مراتب پیروی می‌کنند. بر این اساس، محققان فراگیری زبان فرضیه‌ای را مطرح کردند که بر پایۀ آن، می‌توان ترتیب دشواریِ فراگیریِ بندهای موصولی در زبان دوم را پیش‌بینی کرد. در این مقاله سعی بر آن است تا با بررسی زبانِ میانیِ فارسی آموزان...

متن کامل

بررسی باهمایی ترکیبات پایدار فعلی- اسمی در زبان روسی و مقایسة آن با زبان فارسی

توضیح برخی پدیده‌های زبانی گاهی بسیار دشوار و پیچیده می‌شود، از جمله اینکه چرا در یک زبان، برخی واژگان یا ترکیب خاصی از واژگان وجود دارد یا چرا یک زبان دارای ساختار دستوری، صرفی یا نحوی ویژة خود است. تمامی این پدیده‌ها حاصل فرایند درازمدت رشد و گسترش زبان است. هر فردی بی‌آنکه راجع به آنچه می‌خواهد بگوید تفکر کند، واژگان را در ساختار جمله‌های کامل به‌کار می‌برد. به‌همین ترتیب، در گفتار خود از تر...

متن کامل

پیکره اعلام: یک پیکره استاندارد واحدهای اسمی برای زبان فارسی

Named entity recognition (NER) is a natural language processing (NLP) problem that is mainly used for text summarization, data mining, data retrieval, question and answering, machine translation, and document classification systems. A NER system is tasked with determining the border of each named entity, recognizing its type and classifying it into predefined categories. The categories of named...

متن کامل

واژه‌های پایه‌ی زبان فارسی مبتنی‌بر متون مطبوعاتی

آموزش واژه‌های زبان، یکی از مهم‌ترین مؤلفه‌های آموزش زبان خارجی است که می‌تواند هر چهار مهارت اصلی زبان (شنیداری، گفتاری، خواندن و نوشتن) را تحت تأثیر قرار دهد. بر پایة پژوهش‌هایی که در حوزۀ آموزش واژه انجام شده‌است، واژه‌های پربسامد و پایة زبان، به دلیل فراگیری آسان و کاربرد فراوان در زبان روزمره، از اهمیت ویژه‌ای برخوردار هستند. فهرست واژه‌های پربسامد یا پایه، مجموعه‌ای از واژه‌هاست که در پیک...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 34  شماره 1

صفحات  473- 486

تاریخ انتشار 2018-12

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023